'''
爬虫流程：
    1、发送请求
    通过http库向目标站点发送请求，也就是发送一个Request
    请求可以包含header等信息
    2、获取响应内容
    如果服务器正常响应，会得到一个Response
    Response的内容就是要获取的页面内容
    类型可能是HTML、JSON字符串，二进制数据（图片或者视频）等类型
    3、处理响应内容
    通过代码去分析数据，转化成咱们需要的数据
'''
import requests
# requests.get(url) 发送一个http请求，会得到一个响应Response
response = requests.get("https://www.jju.edu.cn/")
# 查看响应的数据类型
print(type(response))
# status_code 查看响应状态码
# 响应状态码
# 200 成功     500 服务器错误(代码写错了)      400 参数请求不匹配(看情况)
# 404 页面资源找不到      401 没有登录     403 没有权限
print(response.status_code)
# response.text 获取响应的文本信息
# print(response.text)
# 响应的文本内容 数据类型 str类型
# print(type(response.text))
# text可能会出现乱码，content可以获取二进制格式的内容
# print(response.content)
# 通过decode方法可以进行转码
print(response.content.decode("utf-8"))